FILTER MODE ACTIVE

#низкая задержка

Найдено записей: 10

#низкая задержка18.11.2025

Интеллект на поле: как сеть обеспечила работу ИИ в реальном времени на Кубке Райдер 2025

'На Кубке Райдер 2025 HPE развернула сеть и локальное облако для обработки живых потоков с камер и сенсоров, обеспечив оперативные решения и инференс на месте.'

ЧИТАТЬ →

#низкая задержка04.11.2025

Cache-to-Cache (C2C): прямое общение LLM через слияние KV-Cache

'Cache-to-Cache (C2C) дает LLM возможность обмениваться смыслом через KV-Cache, улучшая точность на несколько процентов и снижая задержку примерно в 2 раза по сравнению с текстовым обменом.'

ЧИТАТЬ →

#низкая задержка28.10.2025

MiniMax M2: открытая MoE для быстрых и дешёвых рабочих процессов кодирования и агентных задач

'MiniMax-M2 — компактная MoE с открытыми весами на Hugging Face, оптимизированная под кодирование и агентные цепочки с примерно 10B активных параметров на токен и обещанной скоростью ~2x при ~8% стоимости Claude Sonnet.'

ЧИТАТЬ →

#низкая задержка01.10.2025

Liquid AI выпустила LFM2-Audio-1.5B: энд-то-энд аудио‑модель с задержкой менее 100 мс

'Liquid AI представила LFM2-Audio-1.5B — компактную энд-то-энд аудио‑языковую модель, демонстрирующую задержку менее 100 мс и поддержку ASR, TTS и разговорных агентов.'

ЧИТАТЬ →

#низкая задержка23.09.2025

VoXtream начинает говорить с первого слова — открытый full-stream zero-shot TTS для реального времени

'VoXtream — открытый full-stream zero-shot TTS, который начинает воспроизводить речь после первого слова и обеспечивает низкую первую пакетную задержку для реального времени.'

ЧИТАТЬ →

#низкая задержка12.09.2025

Deepdub Lightning 2.5 — модель голоса в реальном времени с приростом производительности 2.8×

'Deepdub представила Lightning 2.5 — модель для реального времени с 2.8x приростом пропускной способности и задержкой около 200 мс, оптимизированную под NVIDIA GPU.'

ЧИТАТЬ →

#низкая задержка21.08.2025

LFM2-VL: сверхбыстрые открытые мультимодальные модели Liquid AI для локального использования на устройствах

'Liquid AI выпустила LFM2-VL: две открытые мультимодальные модели 450M и 1.6B, оптимизированные для быстрого локального инференса на устройствах.'

ЧИТАТЬ →

#низкая задержка05.07.2025

Kyutai представила стриминговую TTS-модель на 2 млрд параметров с задержкой 220 мс и обучением на 2,5 млн часов

Kyutai представила инновационную стриминговую TTS-модель с 2 миллиардами параметров и задержкой 220 мс, обученную на 2,5 миллиона часов аудио. Модель поддерживает одновременную работу с несколькими пользователями и подходит для реального времени.

ЧИТАТЬ →

#низкая задержка20.05.2025

Microsoft представила систему векторного поиска с интеграцией DiskANN в Azure Cosmos DB: эффективно и с низкой задержкой

Microsoft разработала интегрированную в Azure Cosmos DB систему векторного поиска на базе DiskANN, обеспечивающую масштабируемость, низкую задержку и экономичность для семантических запросов.

ЧИТАТЬ →

#низкая задержка06.05.2025

LLaMA-Omni2: прорыв китайских исследователей в реальном времени с моделями речи на базе больших языковых моделей

Китайские исследователи представили LLaMA-Omni2 — модульную модель речи, обеспечивающую реальное время и минимальную задержку в голосовом взаимодействии с большими языковыми моделями.

ЧИТАТЬ →